Amazon Glue
from AWS SAA学習ログ|Ping-tを活用して本番試験に慣れる 2024/7/12
質問.iconAmazon Glueとは?
サーバレスETLサービス。複数のデータソースからデータを抽出し、変換・統合したデータをターゲット(Redshiftなど)へ格納するといった、データ分析における橋渡しの役割を担う
質問.icon主要概念
クローラー
データソースからデータを抽出し、データカタログを作成する
データカタログ
抽出したデータのメタデータが保存されたもの。データそのものではなく、データソースのどのデータをどのような方法で抽出するかなどの情報が保存されている
ETLエンジン
作成したデータカタログを基に、ETLエンジンがデータソースからデータを抽出し、ターゲットへ書き出す処理を行う